назад

Аудио форматы. Какой лучше ?


MP3

Формат сжатия MPEG Layer III был придуман и запатентован институтом Фраунхоффера в начале 90-х годов ХХ века. Принцип кодирования основан на том, что человеческое ухо воспринимает не все звуки, идущие из динамика, а значит, большое количество информации, записанной на обычных аудио-CD, является избыточным. Например, если возникает сильный звук на определенной частоте, а на частоте чуть выше – слабый, то человек слышит только сильный звук, а слабый при этом «выпадает». Также человек не воспринимает другие звуки за 5 мс до и в течение 100 мс после сильного звука (инертность слуха). Эти и другие особенности позволяют уменьшить звуковые файлы в десятки раз. Правда, чем качественнее звук на выходе ты хочешь получить, тем более «объемистым» будет MP3-файл. Одной из важных особенностей MP3-файлов является наличие так называемого ID3-Tag’а. Он заключает в себе информацию о той музыке, которая записана в файл. Чаще всего ее вносят перед кодировкой файла. На данный момент существует две версии тага: ID3v1 Tag и ID3v2 Tag. Оба они представляют собой несколько полей, в которые вносятся номер трека, название композиции, альбома, композитор (группа), жанр, год, комментарии. Во второй версии тага добавлены еще несколько дополнительных полей. Ты можешь посмотреть все это и на компьютере, если зайдешь в свойства файла в Winamp’e.

MPEG (от Motion Picture Expert Group – группа экспертов по движущимся изображениям) 1 Layer III (реже MPEG 2 Layer III), также иногда именуемый людьми некомпетентными MPEG 3 (такого формата не существует) уже долгие годы является для многих пользователей единственной ассоциацией со словосочетанием "компьютерная музыка". Разработанный в конце 80х годов, нетребовательный к ресурсам (воспроизведение MP3 файлов возможно даже на компьютерах с процессорами 486) формат, позволявший сжимать музыку до 10 раз без катастрофических потерь качества быстро прижился на домашних компьютерах. Хотя еще недавно большинство кодировщиков были платными, сейчас несложно найти проигрыватели и кодировщики, распространяемые по лицензии freeware. Через некоторое время стало ясно, что "CD качество" при битрейте в 128 Кб/с невозможно, по крайней мере с данным стандартом, так как с оснащением компьютеров более совершенными звуковыми картами и акустическими системами позволяло выявить недостатки подобного кодирования. Вполне закономерным стало повышение битрейта и совершенствование кодеков: технологии VBR и Joint Stereo (комбинированное стерео) позволяли значительно сократить размер файла при повышении качества. Современные кодировщики позволяют достичь качества звучания, на слух неотличимого от компакт диска на битрейтах в диапазоне 192-256 Кб/с даже на высококачественной аппаратуре. Тем не менее, в некоторых редких случаях (при наличии хорошего слуха и аппаратуры) даже битрейта 320Кб/с бывает недостаточно. Трудность заключается в том, что сам по себе формат MP3 имеет недостатки, от которых практически невозможно избавиться. Одним из них является так называемый эффект преэхо, из-за которого кодирование определенных сигналов сопряжено со значительными трудностями. На практике же использование постоянного битрейта 320Кб/с зачастую оказывается избыточным и чаще всего приводит к бессмысленной трате места. Качество звучания MP3 файла может сильно зависеть от выбранных кодировщика и проигрывателя. Для создания MP3 файлов идеально подходит бесплатный LAME (кодировщики Fraunhofer являются платными и позволяют достичь сравнимого с LAME качества, а кодеры Xing, Blade и большинство других не заслуживают внимания), а для воспроизведения – одна из последних версий Winamp 2.


MP3pro

Кодек MP3Pro был анонсирован в июле 2001. Появления кодека ожидали с интересом и некоторым нетерпением по двум причинам. Во-первых, этот кодек по своим возможностям обещал быть если не революционным, то очень развитым. Во-вторых, MP3Pro анонсировался и задумывался как продолжение знаменитого «MP3» (MPEG-1 Layer III), а то, что разработкой MP3Pro занимался «папа» MP3 (институт Fraunhofer), внушало доверие и уважение. Несмотря на солидность разработчиков и проекта, MP3Pro довольно долго оставался в тени. Сначала не было ни одной программы не только для кодирования в MP3Pro, но даже для воспроизведения файлов в этом формате. Потом, хотя программы, использующие MP3Pro, и стали появляться, процесс их интеграции проходил вяло и малозаметно для пользователя. И только сегодня MP3Pro стал развиваться и приобретать аппаратную основу, что незамедлительно сказалось на потребительском рынке. В частности, на рынке начали появляться аппаратные плееры, способные воспроизводить аудио в формате MP3Pro. Этот факт является хорошим сигналом для пользователя, говорящим о том, что MP3Pro после всех неурядиц все-таки принят производителями. В данной статье мы кратко рассмотрим историю появления MP3Pro, популярно и доступной форме разберемся в его возможностях, области применения, а также в проблемах, возникающих при использовании кодека. Механизм «упрощения» аудио можно пояснить следующим образом. Исходный аудио поток раскладывается на частотные составляющие спектра. Ясно, что чем меньше «нюансов звучания» имеются в сигнале (чем проще частотный спектр), тем лучше он поддается компрессии. Упростить сигнал можно по-разному. Например, существует ряд способов упрощения информации о стерео панораме сигнала; можно также отфильтровать все частоты выше определенной границы, что автоматически упростит сигнал в высоких частотных областях (но при этом, естественно, заметно испортит звучание). Но основным способом является психоакустический анализ (с последующей соответствующей обработкой сигнала), когда кодер анализирует аудио информацию и, опираясь на указанный пользователем битрейт, «решает» какие тонкости звучания можно выбросить. В качестве справки: при сжатии в MP3 пользователь указывает желаемый битрейт (или границы изменения битрейта) для сжатого выходного потока (битрейт – количество бит, используемых для хранения одной секунды аудио). Чем ниже битрейт, тем меньше бит позволяется кодеру отводить для хранения информации об одной секунде аудио и, таким образом, тем «глубже» кодер упрощает сигнал, что соответственно влияет на качество звучания получаемого сжатого потока аудио. Наиболее распространенное среднее значение битрейта для MP3 колеблется в пределах от 128 до 192 Kbps («килобит в секунду»). Здесь следует заметить, что применение психоакустики приводит к тому, что процесс декодирования уже не способен восстановить утраченные во время компрессии данные (нюансы звучания, отфильтрованные частоты и проч.). Кодек MP3Pro анонсирован в июле 2001 года компанией Coding Tech. вместе с Tomson Mulimedia и институтом Fraunhofer. Формат MP3Pro является прямым продолжением, или точнее, развитием старого MP3. MP3Pro совместим с MP3 «вперед» полностью и «назад» частично. То есть файлы, закодированные с помощью MP3Pro, можно воспроизводить в обычных проигрывателях, однако качество звучания при этом заметно хуже, чем при воспроизведении в специальном MP3Pro-проигрывателе. Это связано с тем, что файл (контейнер) в формате MP3Pro несет в себе два потока аудио: один – стандартный в формате MPEG-1 Layer III, а другой – специальный, дополнительный поток. Обычные проигрыватели MP3 распознают в новом формате только один поток - обычный MPEG-1 Layer 3, это и обуславливает лишь частичную совместимость «назад». В MP3Pro использована новая технология SBR (Spectral Band Replication). Эта технология предназначена для передачи верхнего частотного диапазона. Идея технологии и ее предпосылки следующие. Дело в том, что как и алгоритмы компрессии данных без потерь ограничены в своей эффективности, так и технологии, основанные на использовании психоакустической модели, имеют один общий недостаток: все они работают качественно до битрейта 128 Kbps. На более низких битрейтах начинают проявляться сильные искажения звучания, так называемые «артефакты кодирования»: бульканье, позвякивания, заметные скачки уровня сигнала на различных частотах и проч. Единственный найденный способ борьбы с этим явлением заключается в урезании частотного диапазона сигнала перед компрессией. Однако эта процедура также отрицательно сказывается на восприятии звучания. Все это показывает, что для получения более-менее качественного звучания на низких битрейтах использования психоакустической модели недостаточно. Новая технология SBR от Coding Tech. дополняет использование психоакустической модели. Идея технологии состоит в следующем: в файле передается (кодируется) чуть более узкий диапазон частот, чем обычно (с «урезанными верхами»), а верхние частоты воссоздаются уже самим декодером на основе имеющейся небольшой дополнительной информации о более высоких частотных составляющих. Таким образом, технология SBR применяется фактически не столько на стадии сжатия, сколько на стадии декодирования. Технология SBR в MP3Pro задействована следующим образом. Основные данные кодируются в несколько более зауженном, чем обычно, диапазоне частот в MP3 и записываются в первый основной поток контейнера MP3Pro. Второй, параллельный поток данных, невидимый для обычного MP3-проигрывателя, несет ту минимальную необходимую информацию, которая используется при воспроизведении для восстановления верхних частот. Проведенные автором статьи исследования показывают, что эта информация есть усредненная мощность сигнала в верхнем (урезанном) диапазоне частот. Точнее, не одна усредненная мощность для всего диапазона вырезанных частот, а информация о средней мощности в нескольких полосах частот верхнего диапазона. Такой вывод был сделан на основе следующего несложного, но очень показательного теста. Возьмем тестовый сигнал протяженностью 13 секунд, состоящий из белого шума от 0 до 10 КГц, плюс тон, плавно переходящий от 10 до 19 КГц. Закодируем этот сигнал с помощью MP3Pro (в режиме VBR со средним битрейтом 142 Kbps) и, для сравнения, в обычный MP3 (в режиме CBR на битрейте 140 Kbps). Во время сжатия кодер закодировал в MP3 весь частотный диапазон сигнала ниже 10 КГц, сигнал выше этого рубежа был нарезан на полосы, в каждой такой полосе кодер просто следил за средним уровнем сигнала и сохранял результат в выходном потоке. Пока плавно поднимающийся тон находился в пределах одной подполосы, для кодера средний уровень сигнала в этой подполосе оставался неизменным. Как только тон «уходил» из подполосы, измеряемый кодером уровень сигнала падал до нуля. Во время декодирования декодер, не имея данных о том, что находилось в каждой подполосе, просто брал известный сигнал в нижнем диапазоне (в какой-то определенной области), умножал его на известный средний уровень сигнала в подполосе и размещал в ней полученный после умножения сигнал. Конечно, это лишь искусственный тест, однако он как никакой другой наиболее ярко выявляет механизм работы MP3Pro. Стоит обратить внимание на то, что «старичок» MP3 на битрейте даже чуть ниже MP3Pro достаточно точно и четко «отработал» и сохранил информацию о всем частотном диапазоне.

Какие же выводы можно сделать относительно MP3Pro? С одной стороны, можно говорить о целесообразности использования MP3Pro лишь на низких битрейтах (ниже 128 Kbps). На более высоких битрейтах обычный MP3 справляется с кодированием куда лучше. Кстати, ни один из известных автору статьи кодеров MP3Pro не поддерживает кодирование выше чем на 140 Kbps. Ценителям качественного звука, привыкшим кодировать аудио на высоких битрейтах, автор статьи рекомендует отказаться от использования MP3Pro, так как выдаваемые им высокие частоты не имеют ничего общего с оригинальным сигналом. С другой стороны, примененная в MP3Pro технология SBR очень оправдывает себя на низких битрейтах. Так, на битрейтах 64 Kbps и ниже (там, где обычный MP3 и подобные кодеки совершенно не справляются с кодированием) MP3Pro выходит победителем, поскольку субъективно воспринимаемое качество сигнала MP3Pro оказывается достаточно высоким за счет слышимых, пусть и не настоящих, высоких частот. MP3Pro можно порекомендовать к использованию при осуществлении низкобитрейтных потоковых трансляций в Интернет и создании музыкальных привью. При прослушивании музыки в формате MP3Pro на улице, «на ходу», когда не слишком важно качество звучания, пользователь также выигрывает за счет заметно меньшего объема памяти проигрывателя, занимаемого звуковыми файлами. В заключение отметим, что 9 октября 2002 года компания Coding Tech. анонсировала выход нового кодека AACPlus. AACPlus основан на совершенно аналогичной MP3Pro идее использования технологии SBR. Разница заключается лишь в том, что в MP3Pro основной поток кодируется в MP3 (MPEG-1 Layer III), а в AACPlus – в AAC (MPEG-2/4 AAC). ААС является младшим и намного более развитым кодеком, чем MP3, что позволяет ожидать от AACPlus более качественных результатов кодирования. Однако, относительно нового AACPlus, вероятно, можно будет сделать почти те же общие выводы, что и в отношении к MP3Pro. Данный формат был создан вовсе не для того, чтобы "убить" или "заменить" MP3, позволяя лишь добиться приемлемого качества звучания на низких битрейтах. Если "классический" битрейт в 128 Кб/с некоторыми слушателями и воспринимается, как дающий качество, близкое к идеальному, то даже незначительное его понижение вызывает появление большого количества отчетливо слышимых искажений. Для передачи музыки в интернет используются обычно именно низкие битрейты, которые являются далеко не сильной стороной "обычного" MP3. Здесь MP3pro и проявляет себя с лучшей стороны: частичная совместимость с MP3 (то есть MP3pro файлы, будут проигрываться и обычными MP3 плеерами, не поддерживающими нового формата, но со значительным ухудшением качества) и новая технология SBR, восстанавливающая высокие частоты способны в немалой степени посодействовать продвижению нового формата на просторах глобальной сети. Для хранения музыки высокого качества MP3pro совершенно не годится: даже при использовании максимально доступного для большинства кодеков битрейта 96 Кб/с слышны искажения, хотя по сравнению со многими другими форматами, поддерживающими низкие битрейты результаты работы кодека MP3pro заметно лучше. При повышении битрейта качество файлов падает по сравнению с остальными форматами и уже при битрейтах 128Кб/с разумнее использовать MP3 или OGG Vorbis.

Не думаю, что у MP3pro есть большое будущее: слишком узкая сфера применения (в основном Интернет и портативные MP3 проигрыватели) плюс лицензирование, требующее от разработчиков вложения немалых средств наверняка будут иметь решающее значение в конкурентной борьбе. «Ложкой дегтя» при использовании формата может стать отсутствие доступных бесплатных кодировщиков: демонстрационный кодер/проигрыватель Thomson имеет очень ограниченные возможности и очень неудобен в работе, Jet Audio и MusicMatch Jukebox имеют слишком большой размер и также неудобны. Небольшое замечание: плагин воспроизведения MP3pro/MP3 файлов для Winamp, даже в последней версии содержит ошибки, что может изрядно испортить впечатление от его использования.


MPEGplus/Musepack (MP+/MPC/MPP)

Данный кодировщик похож по принципу действия на MPEG Layer II (MP2), но использует более совершенный алгоритм. В отличие от большинства других современных кодеков целью создателей Musepack было вовсе не стремление получить максимально возможное качество на низких битрейтах: лучше всего формат показывает себя на средних и высоких битрейтах (типичный битрейт файлов обычно находится в диапазоне 160-180Кб/с). Великолепная психоакустическая модель, использующая VBR кодирование позволяет добиться прекрасного качества звучания. В результате кодек показывает результаты более высокие, чем большинство его соперников на аналогичных битрейтах. Скорость работы кодировщика достаточно высока: на создание MPC файла тратится примерно в два раза меньше времени, чем на создание MP3 файла при помощи lame с аналогичными настройками. Качество файлов, получаемых при сжатии в MPC значительно превышает качество аналогичных файлов MP3. При использовании настройки --normal кодировщика я ни разу не смог отличить кодированный файл от оригинала в ABX тесте. Более того, MPC файлы, созданные таким образом звучат лучше, чем высококачественные MP3 файлы с битрейтом 320Кб/с (разумеется, в тех редких случаях, когда данное сравнение можно проводить). Следует сказать, что именно пресет normal является "изюминкой" формата. Данный режим, вопреки названию, дает результат, абсолютно неотличимый от оригинала на слух, причем разницу не ощущают даже люди, обладающие прекрасным слухом и качественным оборудованием.

Одним из серьезных недостатков нынешней версии Musepack является ограничение на формат файла: 44КГц, 16 бит, стерео, что делает его неприменимым для, например, сжатия звуковых дорожек к фильмам на DVD. Отсутствие аппаратной поддержки также может стать препятствием при выборе формата.

Если совместимость с MP3 для вас не слишком важна, а качество итогового файла желательно получить максимально высоким, выбор Musepack может оказаться идеальным решением. Использование этого формата является реальной альтернативой использованию сжатия без потерь для кодирования музыки с компакт дисков тем, кто уже разочаровался в возможностях формата MP3.


WMA 8\9

Патент на формат Windows Media Audio, как легко догадаться, принадлежит Microsoft. Прообразом WMA был небезызвестный формат VQF, разработанный компанией Voxware в составе проекта TwinVQ в 1998 году. После этого компания отделилась от проекта и уже самостоятельно разработала формат Voxware Audio Codec. После его удачного шествия по всему миру, Microsoft заинтересовалась кампанией Voxware, включив поддержку Voxware Audio Codec в Windows Media Player, после чего попросту купила ее. Вопрос качественного отличия MP3 и WMA до сих пор остается открытым. Бытует мнение, что даже при самом высоком битрейте качество звука WMA-файла все же не дотягивает до MP3. Правда, надо учитывать, что большую роль здесь играет качество записи оригинала. Результаты работы кодека WMA оказались немногим лучше, чем в случае использования MP3 с битрейтом 64Кб/с. Для меня остается загадкой, что же именно подразумевалось разработчиками Microsoft, под «качеством компакт диска». Смею вас заверить, что ничего подобного нет и в помине: без особого труда я определял в десяти из десяти случаев кодированные файлы, а различные артефакты WMA файлов откровенно раздражали.

Фрагмент из произведения Бетховена отличить от оригинала было несложно: неестественное звучание духовых инструментов и смазанные звуки струнных не оставляли сомнений в том, что файл сжат lossy кодеком. Музыке Лизы Геррард и Depeche Mode пришлось не легче: ужасные смазанные звуки перкуссии, неестественное звучание гитар... Вообще при прослушивании данных сэмплов мне показалось, что звук воспроизводится в гудящей металлической бочке. Музыка Nightwish также стала звучать заметно хуже: относительно четкая звуковая картина после преобразования в формат WMA существенно изменилась в худшую сторону.

Меня совершенно разочаровал режим кодирования VBR (сжатие с переменным битрейтом). Несмотря на то, что обычно использование переменного битрейта позволяет значительно увеличить качество, мне показалось (при ABX сравнении файлов сжатых в режиме CBR и VBR), что VBR файлы звучат хуже.

Вообще, на слух разница между фрагментами, кодированными при помощи восьмой и девятой версиями кодека не ощущается совершенно. Звук остается все таким же неестественным и со значительными искажениями.

WMA8 является наиболее распростаненной на данный момент версией кодека WMA, нередко используемой для кодирования музыки дома. Значительным преимуществом по сравнению с остальными форматами является тот факт, что зачастую кодеки WMA уже установлены в системе. WMA9 – последняя имеющаяся на данный момент версия кодека, имеющая ряд улучшений, например, режим кодирования с переменным битрейтом. MP3 на данный момент является наиболее распространенным форматом аудиосжатия. Формат Windows Media Audio был разработан всенародно любимой Microsoft в качестве очередного "заместителя" MP3. Помимо обычных для разработчиков обещаний "качество звука, как у MP3, но при вдвое меньшем размере файла" создатели позаботились о защите данных внутри музыкально файла. На практике для рядового пользователя это оборачивалось невозможностью редактировать теги уже готового WMA файла, а также множеством проблем, связанных с так называемыми защищенными WMA файлами (например, записанный дома файл нельзя было воспроизвести на рабочем компьютере). Для того чтобы проиграть защищенный файл часто требовалось загрузить из интернет специальный сертификат, обычно позволявший прослушивать композицию в течение ограниченного времени, по окончании которого вам нужно было либо заплатить за использование файла и получить возможность слушать его в дальнейшем, либо купить компакт диск с понравившейся композицией. Формат постоянно совершенствуется, постепенно появляется поддержка более высоких битрейтов (до 160 Кб/с в новых версиях кодека).

Качество звучания WMA файла вполне сравнимо с качеством MP3 файла с тем же битрейтом, иногда превышая MP3 на низких битрейтах. Немалым плюсом можно считать то, что кодировщики WMA уже встроены в Windows, а последние версии Windows Media Player позволяют кодировать компакт диски сразу же в новый формат. На некоторых интернет сайтах, посвященных сжатию музыки можно встретить призывы не использовать WMA из-за его относительно низкого качества звучания. Лично я через некоторое время отказался от использования данного формата, т.к. на битрейтах 64 и 96Кб/с искажения и артефакты отчетливо слышны даже на не слишком качественной аппаратуре, а повышения качества по сравнению с аналогичными файлами MP3 на более высоких битрейтах я не заметил. Так что заявления Microsoft о том, что WMA 64Кб/с это «CD качество» советую рассматривать не более, чем глупую шутку. На своем сайте Microsoft регулярно проводит тестирование новых версий кодека (преимущественно на битрейтах до 128 Кб/с), противопоставляя им устаревшие или низкокачественные кодировщики MP3. Неудивительно, что WMA выходит в подобных тестах победителем. В данное время формат WMA наряду с MP3 поддерживается большим числом производителей портативных аппаратных проигрывателей, что является несомненным плюсом. Вряд ли файлы, сжатые по технологии WMA удовлетворят качеством звука любителей высококачественной музыки, но менее привередливых пользователей данный кодек вполне может устроить. Недавно появившийся формат WMA9, поддерживает кодирование с переменным битрейтом, а также сжатие без потерь (loseless) . Несмотря на это никаких принципиальных улучшений качества новая версия кодировщика не принесла: сжатие с потерями все еще недостаточно качественна, а результаты loseless компрессии хуже, чем у современных свободно распространяемых кодировщиков.


OGG Vorbis

Один из наиболее перспективных форматов сжатия. Он был опубликован в 2000 году. А главное - OGG Vorbis совершенно бесплатный. Принцип кодирования схож с MP3, но качество звука - значительно выше, и, в отличие от MP3, в файле, записанном в формате OGG, может содержаться до 250 каналов, а значит, можно кодировать звук Dolby Surround. Также OGG-файлы могут содержать изображение и тексты.

Честно говоря, я даже не ожидал подобных результатов от OGG. После полного разочарования в WMA я был крайне удивлен качеством передачи музыки данным кодировщиком. Я так и не смог с полной уверенностью отличить кодированный фрагмент классической музыки от оригинала, закончив тест с результатом 5/10. Разница проявлялась лишь в деталях (небольшая окраска духовых инструментов) и была очень незначительной. Результаты остальных тестов были более предсказуемыми: несмотря на то, что я в десяти из десяти случаев безошибочно определял сжатый фрагмент, для того, чтобы обнаружить разницу, приходилось сосредотачивать внимание на отдельных моментах записи. В основном это касалось четких звуков: например, перкуссия и гитары в композиции Depeche Mode. Результат работы кодека с композицией Nightwish был несколько похуже, но все-таки не разочаровывал, как в случае с WMA или MP3. Кодированный фрагмент угадывался без труда, но звук был относительно четким и не раздражал.

В качестве кодировщика и декодировщика использовались консольные программы Oggenc и Oggdec с сайта разработчика, основанные на финальной версии Xiph.Org libVorbis I.

Еще до выхода финальной версии кодировщика не утихал шум вокруг этого нового формата сжатия музыки. Заявления разработчиков выглядят заманчивыми: полная открытость формата и его свобода от различных патентов (в отличие от MP3 и многих других форматов), поддержка широкого диапазона частот дискретизации (8-48 Кгц) и битрейтов (от 16 до 256 Кб/с на канал), возможность кодирования не только стерео сигнала, но и нескольких каналов аудио данных, высокое качество звучания и многое другое. Считается, что битрейта 160-190 Кб/с достаточно для обеспечения звучания, на слух неотличимого от компакт диска. Лично у меня никаких нареканий по поводу качества не возникало за все время использования формата. По умолчанию многие кодировщики (например, oggdrop) используют специальный режим настройка качества, регулируемый безразмерной шкалой от 0.1 до 10. Обычно 4-5 дает очень хороший результат на большинстве звуковых файлов, а a файл, созданный с параметром –q6 практически неотличим от оригинала. Использование данной шкалы намного удобнее ручной настройки множества параметров кодировщика, так как определенным диапазонам шкалы уже соответствуют оптимальные настройки кодера. По умолчанию для создания Ogg Vorbis файлов используется кодирование в режиме VBR, позволяющем достичь более высокого соотношения качество/размер за счет оптимального выбора битрейта в зависимости от характера музыки, хотя возможно использование постоянного битрейта. Информация об исполнителе, названии композиции и т.д. хранится в Unicode, что позволяет избежать в тэгах проблем с символами, отличными от латиницы, да и сама по себе организация тэгов реализована более грамотно, чем в ID3V2 (достаточно новый формат тэгов MP3/AAC файлов). У разработчиков поистине наполеоновские планы: сделать OGG единственным форматом для хранения музыки и передачи ее через Интернет, вытеснив все остальные "коммерческие" форматы. Не знаю, сумеет ли Vorbis потеснить позиции MP3, но то, что у него есть для этого весьма веские основания - несомненно. По качеству звучания OGG файлы превосходят MP3 на аналогичных битрейтах, а на низких битрейтах (до 64Kb/s) способны соревноваться с MP3pro.


AAC

Формат Advanced Audio Coding (расширенное аудио кодирование), также известный как MPEG2 nbc (not backwards compatible, не обратно совместимый) является преемником формата MP3. Сочетая в себе алгоритмы кодирования MPEG2/MPEG4 AAC имеет более широкие, чем MP3 возможности: возможность кодирования нескольких звуковых каналов с частотой дискретизации до 96Кгц и более высокое, чем у MP3 соотношение качество/размер делают его весьма привлекательным как для создания музыкальной коллекции, так и для кодирования многоканальных звуковых дорожек. Качество звучания файлов, сжатых при помощи AAC оценивается как отличное. Если вы хотите получить относительно небольшого размера файлы с очень хорошим качеством, следует обратить внимание на этот формат. Он прекрасно подойдет как для архивного хранения музыки (без заметной потери качества), так и для создания небольшой высококачественной музыкальной коллекции. На данный момент уже есть несколько моделей аппаратных проигрывателей, имеющих поддержку формата AAC.

Тем не менее в использовании AAC есть свои трудности: алгоритмы кодирования, используемые в данном формате достаточно сложны, поэтому для создания AAC файла требуется значительное количество времени и системных ресурсов. Следует отметить, что существует несколько кодеков AAC, различающихся по качеству/скорости и не всегда совместимых друг с другом. Я бы порекомендовал в качестве кодировщика бесплатно распространяемый psytel. По завершении работы над MP3 была начата разработка кодировщика, который обеспечивал бы лучшее качество звука при сохранении совместимости с MPEG-1. Результатом этих усилий стала технология MPEG-2 Advanced Audio Coding (AAC). AAC (Advanced Audio Coding) - это технология высококачественного кодирования аудиоинформации, используемая множеством приложений в области интернет-вещания и распространения музыки по электронным каналам. По результатам независимых тестов эффективность кодирования в формате AAC оказалась выше, чем в формате MP3, обеспечивая лучшее качество звука при меньшей скорости потока данных. Формат AAC разработан и стандартизирован как часть стандарта ISO/IEC MPEG-2 четырьмя компаниями - лидерами в области аудиокодирования (AT&T, Dolby Laboratories, Fraunhofer IIS и Sony Corporation) и поддерживается все растущим числом производителей программного обеспечения и аппаратных средств. Несмотря на то, что оба формата используют технологию трансформирования информации, они заметно различаются способом трансформации. AAC использует более современные способы кодирования. Например, на карте памяти объемом 32 МБ, используемой музыкальным проигрывателем Nokia, умещается вдове больше музыки в формате AAC, чем в формате MP3, при одинаковом качестве звука.


VQF

VQF (Vector Quantisation Format, формат с векторной квантизацией), является частью спецификации MPEG4. Как формат сжатия музыки VQF ныне мертв. Любой посетитель сайта VQF.com будет встречен следующей не слишком оптимистичной надписью: "VQF.com is now shut down. The VQF format is now out-of-date. We feel it is negligent to continue representing the format as a "cutting edge" one when it is no longer such. This site may reopen with the release of 192kbps VQF. Until that point, however, it will remain closed." Так что же представляло собой данное детище Yamaha? VQF был форматом сжатия музыки, изначально ориентированным на использование низких битрейтов. По заявлениям разработчиков качество звучания VQF файла с битрейтом 80 Кб/с близко к 128Кб/с MP3 (по ряду причин данный битрейт является "камнем преткновения" разработчиков алгоритмов кодирования звука), а битрейт 96Кб/с дает более высокие результаты. Психоакустическая модель VQF существенно отличалась от всех использовавшихся до этого, позволяя получать более высокое качество, чем прежде. Несмотря на данные достоинства, практическое использование формата было несколько затруднено по ряду причин: воспроизведение VQF файлов требовало большей мощности процессора, чем MP3; поиск по файлу осуществлялся медленно, а кодирование одной композиции проходило достаточно долго. Разница в размере файлов по сравнению с MP3 никак не могла компенсировать все недостатки формата, а отсутствие поддержки высоких битрейтов лишь усугубило положение. Еще в 2000 году разработчики заявляли о своих планах по разработке кодера, способного создавать VQF файлы с вдвое большим битрейтом (соответственно, с более высоким качеством), но с тех пор мало что изменилось: последняя версия программы Nero Burning ROM содержит плагин, позволяющий создавать VQF файлы с битрейтом до 192Кб/с. О других программах, поддерживающих VQF2 мне ничего не известно.

Формат аудиосжатия TwinVQ (VQF) Этот формат по праву считается старейшим конкурентом MP3. Алгоритм аудиокомпрессии TwinVQ (Transform-domain Weighted Interleave Vector Quanization - векторное квантование с преобразуемыми доменами и взвешенным чередованием) был разработан японской фирмой Nippon Telegraph and Telephone Corp. (NTT), точнее, ее подразделением Human Interface Laboratories. Патент на использование этого формата принадлежит фирме NTT, которая первой представила на рынке программного обеспечения проигрыватели и кодеки TwinVQ. Эти программы можно найти по адресу http://www.jpn.net/software-e.html. Лицензией на использование данного формата обладает так же всем известная фирма Yamaha, которая, собственно, и осуществляет на протяжении уже более чем двух лет основную поддержку и раскрутку формата VQF. Компания Yamaha, как всегда, подошла к делу очень добросовестно, и, можно сказать, что, предлагаемое ею программное обеспечение для создания и воспроизведения аудиокомпозиций VQF под торговой маркой SoundVQ, является лучшим для данного формата на текущий момент, как по дизайну, так и по качеству кодирования/декодирования звука. Загрузить SoundVQ можно по адресу http://www.yamaha-xg.com/english/xg/index.html. В процессе установки VQF плеера так же инсталлируются и подключаемые модули (plugin's) для браузеров Netscape и IE позволяющие воспроизводить аудиокомпозиции в формате VQF непосредственно из сети Internet. Кодер SoundVQ Алгоритм TwinVQ позволяет сжимать оцифрованные аудиопотоки со степенью сжатия до 1:20. Этот формат по основным концепциям, используемым при компрессии аудиоданных, сильно напоминает MP3, но при этом используется совершенно иная психоакустическая модель. Соответственно и выбор "нужных" и "ненужных" звуков осуществляется по совершенно иным критериям. Размер файлов VQF в среднем на 30-35% меньше, чем MP3, при примерно одинаковом качестве звука. Так, например, качество звучания потока TwinVQ при bitrate 96 Кбит/с практически идентично качеству звучания потока MPEG-1 Layer III (при bitrate 128 Кбит/с) и семейству MPEG-2 AAC (при bitrate 96 Кбит/с). Алгоритм TwinVQ позволяет также как и MP3, производить декодирование и воспроизведение потока непосредственно при его получении (stream playback). Но если композиция в формате VQF и не докачается, то ее все равно можно прослушать до места обрыва. Как показали тесты, как программные, так и акустические, с использованием живых тестеров, VQF превосходит МР3 по всем параметрам в нижней области звукового спектра, но проигрывает последнему в области верхних частот. На частотах выше 15 кГц, VQF на 2-3 дБ уступает MP3. При всем при этом, VQF вносит гораздо меньшее искажение формы сигнала в композициях с большим динамическим диапазоном (реальная музыка). Такое высокое качество при сравнительно низком bitrate достигается благодаря использованию более совершенных алгоритмов сжатия, но при этом резко возрастает загрузка процессора, как при кодировании, так и при декодировании аудиофайлов. Кодеки TwinVQ при компрессии аудиоданных работают, как правило, в 5-10 раз медленнее, чем кодеки MPEG Layer III. При декодировании файлов VQF проигрывателем, загрузка процессора на 30 - 40% выше, по сравнению с декодированием MP3. Соответственно минимальные требования к конфигурации компьютера для TwinVQ гораздо выше чем для MP3. Так, немногочисленные уже владельцы 486 машин могут забыть о существовании формата VQF и продолжать использовать некоторые высокоскоростные кодеки MP3. В качестве стартового условия для качественного проигрывания аудиокомпозиций в формате VQF нужен как минимум процессор Pentium-90, но более оптимальным решением будет Pentium-200 MMX, так как на более медленных процессорах вы сможете лишь слушать музыку и ничего более, что бы не вызвать у компьютера заикания. При компрессии аудиофайлов в формат VQF так же сказывается высокая ресурсоемкость алгоритма TwinVQ. Несмотря на то, что в качестве минимального условия разработчики называют процессор Pentium-66, разумнее будет выбрать более высокоскоростной процессор, так как даже на Pentium-200 MMX кодирование 4-х минутной аудиокомпозиции с максимальным приоритетом (курсор мышки движется рывками) занимает не менее 20 минут машинного времени. Это гораздо больше, чем при кодировании MP3, но что поделаешь, более высокая степень компрессии требует больших затрат времени. Сравните например время сжатия архиваторов ZIP и RAR, аналогия очевидна. Помимо более высокой загрузки процессора при кодировании/декодировании аудиофайлов, для формата VQF характерна очень медленная перемотка, которая реализуется за счет быстрой распаковки файла. Формат VQF поддерживает bitrate от 8 kbs до 48 kbs на канал (соответственно максимальный bitrate для стереокомпозиций составляет 96 kbs). Поддерживается кодирование с переменным bitrate. Из не стандартных по сравнению с МР3 возможностей можно назвать поддержку несимметричных bitrate, например один канал может кодироваться с bitrate 10 kbs, а другой с bitrate 11 kbs. Наработки TwinVQ совместно с AAC используются в звуковой части новейшего стандарта видеосжатия MPEG-4. На текущий момент в Интернет существует достаточно много аудиокомпозиций в формате VQF, но по сравнению с MP3 это, конечно капля в море. Тем не менее, этот формат превосходно подходит для того, чтобы уменьшить свою частную коллекцию аудиозаписей на треть практически без потери качества. Впрочем, на VQF свет клином не сошелся, существуют и гораздо более перспективные и качественные форматы, о которых речь пойдет далее.


ADPCM

Кодек Microsoft ADPCM (Adaptive Differential Pulse Code Modulation, адаптивная дифференциальная импульсно-кодовая модуляция), некогда популярный у пиратов, не желавших тратить время на кодирование музыки в MP3 - далеко не образец качества. Для уменьшения объема файла приходилось создавать восьми или даже четырехбитные wave файлы с частотой дискретизации 22Кгц, что давало весьма слабый результат. И если MP3 файл с фиксированным битрейтом 128Кб/с звучит более-менее сносно (а для некоторых слушателей - идеально), то аналогичного размера wave файл, сжатый кодеком ADPCM звучит просто ужасно. ADPCM использует очень простой алгоритм сжатия, который обеспечивает высокую скорость кодирования на слабых компьютерах, но абсолютно неприменим для хранения музыки. Крайне низкое качество звучания при приемлемой степени сжатия привели к тому, что в данный момент для сжатия музыки данный кодек почти не используется. Исключением являются компьютерные игры, создатели которых нередко используют ADPCM WAV файлы для хранения саундтреков.


Liquid Audio

Еще один закрытый коммерческий формат. Используя современные высококачественные алгоритмы AAC и ATRAC он позволяет получить результат по качеству звучания превосходящий аналогичный MP3 файл. Кроме самого аудиотрека внутри LQT файла может храниться дополнительная информация: сведения об исполнителе и альбоме, тексты песен, графика и т.д. Содержимое файла шифруется во избежание нелегального копирования. Недостатком для домашнего использования может являться сложность декодирования файлов LQT в wave (для последующей записи на CD-R/RW) и отсутствие бесплатных кодировщиков. Для кодирования музыки дома лучше подойдет "обычный" AAC.


Выводы:

MP3 - является универсальным форматом, если вы xотите прослушивать музыку на DVD проигрываетеле или на музыкальном центре, то этот формат будет наилучшим решением. Используйте битрейт 128-256. Сжатие к отношению wav - 30.

WMA - этот формат также является распространённым, он читается на некоторыx плейераx, DVD проигрывателяx и музыкальны центраx. Используйте битрейт 64-128. Сжатие к отношению wav - 40.

OGG Vorbis - этот формат лучше всех подойдёт для прослушивания музыки на компьютере. Является самым качественным форматом аудио, и самым сжатым. Используйте битрейт 64-80. Сжатие к отношению wav - 50.

Mp3pro - этот формат лучше всех подойдёт для вещание в интернете радиостанции, так как лучше всех себя ведёт на низких битрейтах. Сжатие к отношению wav - 50.

AAC - формат, используемый в основном в проигрывателях или в создании звуковой дорожки с более 2 каналов(ogg также поддерживает более 2-х каналов, но он даёт меньше эффекта, чем AAC). Сжатие к отношению wav - 40.

назад
macolor site
Сайт управляется системой uCoz